【セッションレポート】生成 AI が変える、データアナリティクス(AWS-11) #AWSSummit
コーヒーが好きな emi です。
本記事は 2024 年 6 月 20 - 21 日の 2 日間開催された AWS Summit Japan 2024 のセッションレポートとなります。
オンデマンド配信の動画リンクと資料のダウンロードは以下です。
動画の視聴と資料のダウンロードには AWS Summit Japan のマイページのログインが必要です。
AWS Summit Japan 2024 アーカイブはこちら
セッション概要
- 6/20(木) 15:50 - 16:30
- テーマ:生成 AI
- セッションタイトル:「生成 AI が変える、データアナリティクス」(AWS-11)
生成 AI は猛烈なスピードで様々なドメイン、ロールに適用されつつあります。AWS re:Invent 2023 では Generative BI という キーワードと共に、Amazon Q in QuickSight が発表され、QuickSight の AIアシスト機能がより一層強化されました。また、Amazon Q generative SQL が発表され、Amazon Redshift クエリエディタ経由で自然言語による SQL 生成が可能となりました。本セッションでは、生成AI × Analytics というテーマで、主要な Analytics サービスにおける生成AI機能を紹介します。また、生成AIがデータアナリティクスにもたらす影響と、それに対応するために必要とされるスキルセットについても一部考察していきます。
スピーカー
西澤 祐介
アマゾン ウェブ サービス ジャパン合同会社 プロフェッショナルサービス本部 ビッグデータコンサルト
レベル
Level 300: 中級者向け
アジェンダ
生成AI × AWS に可能性を感じる、生成 AI 時代のアナリティクスに備える
- 1. 生成 AI の概要と AWS 生成 AI スタック
- 2. 生成 AI × AWS アナリティクスサービス
- 3. 生成 AI によって変わっていくデータアナリティクス
セッションレポート
大きく以下の内容でした。
- データアナリティクス(データ分析)に関連する AWS の生成 AI サービスの紹介
- 生成 AI がデータアナリティクスにどのようなインパクトをもたらすのか
1. 生成 AI の概要と AWS 生成 AI スタック
- 生成 AI とは、大量のデータから大量の計算など多くのリソースを投下して学習したもの
- 従来のモデルとの違い
- 従来:予測、分類
- 現在:新しいコンテンツの生成
- AWS における生成 AI アプリケーション開発の支援
- 様々なデータベースが生成 AI サービスとシームレスに連携
- データ変換に必要だった ETL スクリプトの作成が、Zero-ETL 統合により不要になってきている
- データへのアクセス制限などにより「責任ある AI」の実現を支援
- AWS における生成 AI に関するサービスの種類
- 高パフォーマンスのインフラリソースによる学習環境の提供
- Bedrock による様々なトレーニング済みモデルの提供
- 生成 AI を活用した優秀なアシスタント:Amazon Q
2. 生成 AI × AWS アナリティクスサービス
- 以下 3 種類のロールのユーザーに向けた機能・サービス
- データエンジニア
- データアナリスト
- ビジネスユーザー
データエンジニア向け
AI recommendations for description in Amazon Datazone
- Amazon Datazone
- データの共有管理機能とクエリ実行機能が付いたデータカタログツール
- データを安全に保管し、必要なデータに必要な人がアクセスでき、監査履歴を残す…など
- データの共有管理機能とクエリ実行機能が付いたデータカタログツール
- ビジネスコンテキストに基づいたデータを ビジネスメタデータ として管理
- 最も重要なメタデータはビジネスメタデータ
- データは「どのように使うものなのか」という情報が最も重要
- 既存アプローチだとデータエンジニアが手動でビジネスメタデータの説明を作成して Excel 保管をしていたりする
- AI recommendations for description in Amazon Datazone
- こういうデータです、こういう風に使います、これは個人情報が含まれるので注意してね、ということを生成 AI が自動生成してくれる!!
- デモ:英会話アプリのデータを使って実演
Amazon Q data integration in AWS Glue
- ETL の課題として、必要な変換処理の ETL コードを書く必要があったり、リアルタイムの変換処理が必要だったりする
- Amazon Q data integration in AWS Glue で ETL コードを自動生成できる
- スクリプトエディタとノートブック形式で提供されている
- 様々なフォーマットに対応(CSV、JSON、Parquet etc...)
- 20以上のデータソースに接続可能
- デモ
- 「S3 からこういう形式でデータを取り出していくつかのフィールドを選択してください」などの自然言語でプロンプトを記入すると、その操作をする ETL 処理のコードを生成してくれる!
データアナリスト、ビジネスユーザー向け
Amazon Q generative SQL in Amazon Redshift Query Editor v2
- Amazon Redshift Query Editor v2
- スキーマ管理、SQL 実行などができる
- ノートブックインスタンスがあるので結果を残したり、考察を加えたり、可視化して共有することも可能
- Amazon Q generative SQL in Amazon Redshift Query Editor v2
- ビジネスでの活用が進む中必要な分析を毎回データアナリストに依頼して分析をかけていると、データアナリストに負荷がかかってしまう
- Amazon Q generative SQL in Amazon Redshift Query Editor v2 を使うことで、ビジネスユーザー自身で分析できるようになる
- 生成 SQL = 自然言語でSQLが生成されます
- メリット1:コンテキストを加味して生成してくれる(先月の売上はいくら?とか)
- メリット2:使うほど精度があがる
- デモ:英会話アプリのデータを使って実演 -コホート分析もできる
Generative BI capabilities in Amazon QuickSight
- これまでのデータアナリストの課題
- BIツールが多く学習コストが高い
- 高機能になるたび操作が複雑化して開発効率が悪くなる
- これまでのビジネスユーザーの課題
- 与えられたものでしか分析できない
- ダッシュボードからレポートを出すのに時間がかかる
- Generative BI capabilities in Amazon QuickSight
- 自然言語でダッシュボードを生成
- 計算フィールドなども自然言語で生成
- ダッシュボードの見た目の調整も自然言語でできる
- 不要な項目を消す、ラベルを消すとか
- 自然言語でデータと対話
- 自然言語で質問すると、ダッシュボードと言語によるマルチビジュアルで回答してくれる
- ビジネスレポートの自動生成
- 自然言語でダッシュボードを生成
- デモ:英会話アプリのデータを使って実演
3. 生成 AI によって変わっていくデータアナリティクス
- データアナリティクスにおける認知的飛躍の加速
- AI が分析してビジネスのストーリーを提案してくれる
- 人間と AI の双方の意見を持って意思決定する場面が増えていく
- データアナリストとビジネスユーザーの関係の変化
- 今までは分業していたが、今後はより役割が融合していく
- ビジネスユーザー自身で分析をするようになったり、データアナリストが意思決定者になったり
- データアナリストに求められるもの
- 生成 AI に問い合わせをする力
- 生成 AI との共存姿勢
- 生成 AI が回答しやすい環境、データを準備する力(データマネジメントスキル)
ワークショップのご紹介
感想
データや SQL に詳しくなくても、人に何かをお願いするような聞き方(自然言語)でメタデータの説明や SQL を生成できるのはとても便利ですね。
ビジネスユーザーとデータアナリストの境目が薄くなり、ビジネスユーザー自身で分析したり、データアナリストが意思決定に参加したりするようになる…という流れは今後大きくなっていくのだろうなと感じました。 デモも多く共有いただき、具体的なイメージもわきやすかったです。
一方で、生成した SQL が自分の望んだ正しい SQL なのかどうかは有識者が判断する必要がありますし、分析結果が正しいかどうかは人間が判断する必要があります。
とは言え、ゼロからデータアナリストに分析を依頼するよりは圧倒的にスピード感を持って分析できるようになるので、その変化は大きいですね。